Los datos han sido tomados del Departamento de Salud y Servicios Humanos de EE.UU, en su Centro de control y prevención de enfermedades. La base de datos seleccionada ha sido Indicadores de ansiedad o depresión basados en la frecuencia informada de los síntomas durante los últimos 7 días y se accede mediante este enlace.
La relevancia de los datos reside en el tema que trata al manifestar la importancia del bienestar de la salud mental ante los problemas de ansiedad y depresión que el Covid-19 ha traído a los hogares e impactado a las familias en Estados Unidos. Son datos recolectados y actualizados cada 7 días desde el inicio de la pandemia Covid-19 en el 2020. Se destaca que se ha empleado para el estudio a diferentes grupos de la población, como Estado, edad, raza o etnia, educación, sexo y género con el que se identifican.
En este trabajo se busca analizar de manera visual la información del dataset aplicando diferentes técnicas de visualización y de responder a las preguntas:
La exploración de los datos busca explicar las principales características de los mismos. Ejemplo de los datos que conforman la base de datos. Las variables que la componen son de diferentes tipos: categóricas, numéricas y fecha.
## 'data.frame': 11718 obs. of 14 variables:
## $ Indicator : Factor w/ 3 levels "Symptoms of Anxiety Disorder",..: 3 3 3 3 3 3 3 3 3 3 ...
## $ Group : Factor w/ 9 levels "By Age","By Disability status",..: 9 1 1 1 1 1 1 1 6 6 ...
## $ State : Factor w/ 52 levels "Alabama","Alaska",..: 45 45 45 45 45 45 45 45 45 45 ...
## $ Subgroup : Factor w/ 78 levels "18 - 29 years",..: 69 1 2 3 4 5 6 7 37 21 ...
## $ Phase : Factor w/ 11 levels "-1","1","2","3 (Jan 6 – Mar 29)",..: 2 2 2 2 2 2 2 2 2 2 ...
## $ Time.Period : num 1 1 1 1 1 1 1 1 1 1 ...
## $ Time.Period.Label : Factor w/ 59 levels "Apr 14 - Apr 26, 2021",..: 2 2 2 2 2 2 2 2 2 2 ...
## $ Time.Period.Start.Date: Date, format: "2020-04-23" "2020-04-23" ...
## $ Time.Period.End.Date : Date, format: "2020-05-05" "2020-05-05" ...
## $ Value : num 23.5 32.7 25.7 24.8 23.2 18.4 13.6 14.4 20.8 26.1 ...
## $ Low.CI : num 22.7 30.2 24.1 23.3 21.5 17 11.8 9 19.6 25.2 ...
## $ High.CI : num 24.3 35.2 27.3 26.2 25 19.7 15.5 21.4 22 27.1 ...
## $ Confidence.Interval : chr "22.7 - 24.3" "30.2 - 35.2" "24.1 - 27.3" "23.3 - 26.2" ...
## $ Quartile.Range : chr "" "" "" "" ...
Se va a analizar la distribución de las variables categóricas en función de otras subcategorías como edad, género o nivel de estudio.
Distribución del valor IC vs Indicador
Distribución del valor IC vs Grupos
Distribución del valor IC en Grupo:Edad vs Subgrupos
Distribución del valor IC en Grupo:Educación vs Subgrupos
Frecuencia de cada grupo por edad respecto a la fase del proyecto
Se observa que en cada fase se ha registrado la misma cantidad de personas para cada grupo de edad.
Distribución del valor IC en Grupo:Status de discapacidad vs Subgrupos
Distribución del valor IC en Grupo:Identidad de género vs Subgrupos
Distribución del valor IC en Grupo:By Race/Hispanic ethnicity vs Subgrupos
Distribución del valor IC en Grupo:Sexo vs Subgrupos
Distribución del valor IC en Grupo:Orientación sexual vs Subgrupos
Distribución del valor IC en Grupo:Estado vs Subgrupos
Distribución del valor IC en cada Fase
Distribución del valor IC en cada periodo de tiempo
Se busca analizar y visualizar la evolución de los niveles de CI por el periodo de tiempo que los datos han sido tomados. Dado que se trabaja con valores en función del tiempo, una serie de tiempo permite proyectar resultados y estimar valores para un año después.
## Series: ts_serie[, 8]
## ARIMA(0,0,0)(0,1,0)[12]
##
## sigma^2 = 20.13: log likelihood = -64.24
## AIC=130.48 AICc=130.68 BIC=131.58
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE ACF1
## Training set 0.311 3.609288 2.499235 1.092679 10.57363 0.649152 0.2794565
Finalmente, la base de datos y la información que aporta va dirigida al público en general para que conozcan la importancia de la salud mental como efecto colateral de la pandemia Covid-19. Después de tanta explotación de las bases que muestran los casos de fallecidos y tratados por covid, es bueno que se conozca el impacto de la pandemia en la situación laboral, el gasto de los consumidores, la seguridad alimentaria, la vivienda, las interrupciones en la educación y en especial en el bienestar físico y mental.
Desde lo personal, se busca responder a la interrogante de que periodo de tiempo fue el más difícil, en cuanto a salud mental, para las personas durante la pandemia. Se destaca nuevamente la importancia del bienestar mental en una época con importantes avances tecnológicos.